実践的なRAGシステム：知識ベースから検索拡張生成へ：トレーニング終了時点を超えて：なぜLLMは外部知識が必要なのか

大規模言語モデルは流暢な文章を生成できますが、流暢さと事実の信頼性は同じではありません。LLMの根本的な制限は、パラメトリックメモリ——訓練が終了した瞬間に凍結された知識であり、トレーニング終了時点（training cutoff）と呼ばれます。

なぜLLMは孤立して失敗するのか

RAGが存在するのは、多くの実用的な質問が機密情報、最新の情報、バージョン管理されている、分野特化型の、または監査可能に依存しているためです。外部知識がない場合、モデルは次の課題を抱えます：

時間的制限：訓練後の出来事についての知識が得られないこと。
アクセス制限：『ダークデータ』（企業の機密文書）へのアクセスが不可能であること。
追跡可能性の制限：専門職における責任追及のための監査可能な履歴がないこと。

オープンブックパラダイム

高コストな再トレーニングでモデルにすべてを『記憶させよう』とする代わりに、まず外部のコアスから特定の証拠を取得するアーキテクチャに移行します。これにより、LLMはその証拠を視認しながら回答できるようになります。これにより、証拠に基づく自信それ自体に自信を持つというより、証拠がある状態での自信を提供します。

インタラクティブアプリケーション：幻覚リスク

トレーニング終了時点の批判的分析

法務研究者がLLMに尋ねます：『カリフォルニアプライバシー権利法の2024年改正内容を要約してください』。しかし、このモデルのトレーニングは2023年末に終了しています。

1. この状況下で、基本的なLLMが最も危険な失敗モードとなる可能性があるのはどのようなものか？

答え：
モデルは2020年や2023年のデータに基づいて、ありそうに聞こえる要約を幻覚的に生成し、それを2024年のバージョンとして提示する可能性があります。なぜなら、モデルの主な目的はトークンの流暢さであり、事実の検証ではないからです。

2. 外部知識として2024年のPDFを提供することで、モデルの運用モードはどのように変わるか？

答え：
モデルは『閉じた教科書』の受験者（重みに依存）から、『開かれた教科書』の研究者にシフトします。モデルは提示されたテキストを『読み取り・報告』する形で、回答が検証可能な証拠に基づいていることを保証します。

3. 【短答】この論文を平易な英語で要約してください。（講義概要に記載された内容を参照）

答え：
この論文は、独立したLLM生成から根拠のあるRAGシステムへの移行を概説しています。事実の信頼性を確保するには、『凍結された』トレーニングデータの限界を克服するために、メタデータとバージョン管理を備えたインジェストパイプラインが必要であると強調しています。

4. 【短答】教授に延長を依頼する丁寧なメールを書いてください。

答え：
件名：延長申請 - [あなたの名前] - [授業名] [教授の姓]先生へお忙しい中恐縮ですが、今週も良いご一日をお過ごしのことと存じます。[課題名]の提出期限が[元の提出日]となっておりますが、[簡単な理由を述べる、例：予期せぬ健康上の問題など]のため、提出物の品質が授業基準に合致するよう、数日余分に時間を頂戴できればと考えております。[提案する新しい提出日]までに提出できるでしょうか？ご多忙の中、お時間を割いていただき、誠にありがとうございます。敬具、 [あなたの名前]